Filtrage bayésien de la récompense
نویسندگان
چکیده
Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail général pour l’apprentissage par renforcement basé sur le filtrage bayésien, ainsi qu’une implémentation spécifique basée sur un filtre de Kalman à sigma-points et une paramétrisation par noyaux. Cela nous permet de proposer un algorithme de différences temporelles pour des espaces d’état et/ou d’action continus qui soit model-free et off-policy. Il sera illustré sur deux problèmes simples. Mots-clés : Apprentissage par renforcement, filtrage bayésien, méthodes à noyaux.
منابع مشابه
Le filtrage collaboratif et le web 2.0. État de l'art
RÉSUMÉ. Le présent article fait le point sur l’état de l’art des systèmes de filtrage d’information. Il présente les différentes techniques de filtrage proposées dans la littérature dont le filtrage à base de contenu, le filtrage collaboratif et les modèles de filtrage hybrides. Il présente également les différentes limitations dont souffre toujours ce type de systèmes notamment la rareté des v...
متن کاملRELIEFS : Un système pour le filtrage adaptatif de documents textuels basé sur la notion de résonance
Résumé : Nous présentons le système RELIEFS pour RELevance Information Extraction Fuzzy System dédié au filtrage adaptatif de documents textuels. Ce système s'inspire très largement de mécanismes cognitifs intervenant dans les processus de sélection d'information. En particulier, il implémente l'idée de résonance introduite dans la théorie cognitive ART [GROS 76] qui rend compte de la façon don...
متن کاملCOCoFil: une plateforme de filtrage collaboratif orientée vers la communauté
RÉSUMÉ. Face à la quantité et la rapidité d'apparition de nouvelles informations au quotidien, l’utilisateur peut s’en remettre non seulement à des systèmes de filtrage d’information par le contenu mais aussi à des systèmes de filtrage collaboratif. Ainsi, il peut recevoir des recommandations grâce aux évaluations de la communauté des personnes partageant les mêmes centres d'intérêt. Cependant,...
متن کاملModèle d'espaces de communautés basé sur la théorie des ensembles d'approximation dans un système de filtrage hybride
RÉSUMÉ. Les systèmes de filtrage ont pour but de distribuer des informations de façon personnalisée aux utilisateurs, tout en s’adaptant en permanence au besoin en information de chacun. Dans un système de filtrage hybride s’appuyant sur le filtrage collaboratif, la production de recommandations se base sur des communautés d’utilisateurs qui sont généralement formées conformément au seul critèr...
متن کاملApprentissage par renforcement dans un système de filtrage adaptatif
RÉSUMÉ. Cet article présente une méthode incrémentale d’apprentissage des profils dans les systèmes de filtrage d’information. Cette méthode est basée sur le principe de renforcement. L’idée de base consiste à construire, à chaque arrivée d’un document pertinent, un profil " provisoire " permettant de sélectionner le document en question avec un score " fort ", puis intégrer ce profil, grâce à ...
متن کامل